BASES DE DATOS Y GESTORES DE 
BASES DE DATOS PARA LOS SISTEMAS 


DE INFORMACIÓN GEOGRÁFICA 


por 
PILAR CHÍAs NAVARRO 


CUADERNOS 
DEL INSTITUTO 
JUAN DE HERRERA 
DE LA ESCUELA DE 
ARQUITECTURA 
DE MADRID 


5-11-05 


BASES DE DATOS Y GESTORES DE 
BASES DE DATOS PARA LOS SISTEMAS 


DE INFORMACIÓN GEOGRÁFICA 


por 
PILAR CHÍAS NAVARRO 


CUADERNOS 
DEL INSTITUTO 
JUAN DE HERRERA 
DE LA ESCUELA DE 
ARQUITECTURA 
DE MADRID 


5-11-05 


CUADERNOS 
DEL INSTITUTO 
JUAN DE HERRERA 


VARIOS 
ESTRUCTURAS 
CONSTRUCCIÓN 

FÍSICA Y MATEMÁTICAS 
TEORÍA 

GEOMETRÍA Y DIBUJO 
PROYECTOS 
URBANISMO 
RESTAURACIÓN 


0 3 DN GU LY 40 N » 


NUEVA NUMERACIÓN 


5 Área 
11 Autor 
05 Ordinal de cuaderno (del autor) 


Bases de datos y gestores de bases de datos para los sistemas de 
información geográfica 

O 2004 Pilar Chías Navarro 

Instituto Juan de Herrera. 

Escuela Técnica Superior de Arquitectura de Madrid. 

Gestión y portada: Nadezhda Vasileva Nicheva 

CUADERNO 174.01 / 5-11-05 

ISBN: 84-9728-117-9 

Depósito Legal: M-44372-2004 


BASES DE DATOS Y GESTORES DE BASES DE DATOS PARA LOS 
SISTEMAS DE INFORMACIÓN GEOGRÁFICA 


Índice 
4, Las bases de datos y los gestores de bases de datos................. 3 
1.1 Las características y organización de una base de 
o AAA A 6 
y Las estructuras de los archivos de datos............................ooooo.o.... 12 
2.1 LA ORTAMZACIÓN NO: DIENAA. .scmecinc orinar a 13 
22 . LREORTUCNS ICON scan rio arco ends 14 
e A o o AMAS 16 
A o MMM 16 
3. Las relaciones existentes entre los datos: “uno a uno”, 
“uno a muchos”, “muchos a Muchos” Lucoooococccccnoccninanccinconnnonon 19 
4, Ordenaciones uni- y bidimensionales. .......................ooomo.....m.... 20 
Comentarios bibliográficosS.....................o.ooooooonooccnonioocancnononanononncnrononananoronos 28 
a A II A 29 


A 
/ 
| 
| 
| 
| 
| 
| 


[ 

IT RO | PROGRAMA DE 
| 
l 


| ARCHIVO DE YH 
ACTION 1 
DATOS 1 Dl a: APLICACION | " 
A A IN EE 4 A > 
| Ss, zz eS ES 
pr y P SS A 


| (A ASA | ze 
IZ e ye 
| $ o 


DATOS 2 


Ge ( ZÉ, 
Es 
q Y Y PROGRAMA DE O 
ARCHIVO DE Va q PRA ás SALIDA 2 
DATOS 3 H———— >) : Él | L 


BASE DE DATOS 


Salida 1 


Sistema de Gestión 
de la 


Base de datos 


DBMS 8 
(ODBC) E CS Salida 2 


BASES DE DATOS Y GESTORES DE BASES DE DATOS 


Conocidas las posibilidades de definir matemáticamente las entidades y relaciones 
más frecuentes dentro del dominio de aplicación o ámbito espacial de estudio, es 
necesario diseñar el modelo de datos que se va a utilizar. 

Éste define el “almacén” de los datos (base de datos) a todos los niveles del SIG. Es 
decir, que el modelo de datos actúa tanto al nivel del diseño concreto de la base de 
datos (modelo lógico de datos), como al de su aplicación sobre un sistema y 
plataforma particulares y con unos dispositivos de almacenamiento determinados 
(modelo físico). 


Por tanto el modelo de datos tiene que poder ser procesable por el ordenador, a la vez 
que ha de permitir al usuario interactuar con él y acceder a la base de datos para 
efectuar las extracciones y las consultas oportunas. Y todo ello ha de realizarse con la 
mayor rapidez y seguridad. 


Precisamente porque el proceso ha de ser informatizable, resulta conveniente recordar 
previamente algunos conceptos generales relativos a estos almacenes de datos y a 
sus gestores, para después avanzar en las diferentes posibilidades de definición del 
modelo de datos de acuerdo con las geometrías anteriormente expuestas y con las 
necesidades concretas que cada SIG plantea. 


7 Las bases de datos y los gestores de bases de datos. 


Una base de datos es un almacén de datos que puede ser compartido por varios 
usuarios. Los datos pueden ser números, cadenas de caracteres, textos, imágenes, 
configuraciones espaciales e incluso sonidos; es decir, todo aquéllo que pueda ser 
medido, grabado, y a lo que se le pueda asignar un significado. 


Los datos que poseen un significado en virtud de su contexto y de sus relaciones con 


otros grupos de datos, se han transformado en información. 


Series 


temporales 
de de) 


Prof, Chías 


Todos los datos de un SIG, tanto si son espaciales como si son atributivos, se 
almacenan en bases de datos; para ello se unifican siguiendo criterios lógicos y se 
estructuran de determinadas maneras. Asimismo los datos pueden estar físicamente 


distribuidos en lugares diferentes, así como ser accesibles por diferentes usuarios. 


Los primeros Sistemas de Base de Datos (DBS) fueron programas que se 
desarrollaron para realizar un pequeño conjunto de funciones bien definidas y 
utilizando un grupo de datos determinados. En general, se limitaban a transformar el 
primer grupo de datos en otro a través de un largo y complicado proceso, por lo que en 
definitiva eran como “calculadoras gigantes”. 


Ello planteaba serios problemas porque: 


El programa accedía directamente a la base de datos, lo que requería conocer 
su estructura de almacenamiento. 

Existía redundancia en las instrucciones de acceso a la base, porque tenían 
que repetirse. 

Y al carecer de un control centralizado y existir la posibilidad de un acceso 
simultáneo por parte de varios usuarios, se favorecía la capacidad de alteración 
y degradación de los datos. 


A la vista de los inconvenientes, que redundaban en falta de eficacia, surgió una 


segunda tendencia que consideraba el ordenador como un gran almacén de datos, y 


para ello se dotó a aquél de ciertas capacidades para facilitar el almacenamiento, la 


recuperación, la modificación y el análisis. 


Con este fin se diseñaron los Sistemas de Gestión de las Bases de Datos (Database 


Management System, DBMS), que son programas de propósito general que crean y 


mantienen las bases de datos actuando como un control central sobre todas las 


interacciones que tienen lugar entre la base de datos y los programas de aplicación. 


Las características de los gestores de bases de datos son: 


El control centralizado de las condiciones de accesibilidad a los datos, que 
impide la acción de ciertas funciones para mantener la calidad de los mismos. 
Ello no excluye la posibilidad de que varios usuarios compartan 
simultáneamente los datos, pero siempre de un modo controlado. En general 
soportan una gran variedad de usos, que van desde las consultas esporádicas 
e imprevisibles, hasta las habituales y expertas. 

Facilitan el acceso al usuario porque poseen unos mecanismos de interacción 
entre éste y los datos (interfaces), que facilitan las operaciones. En general, los 
usuarios pueden interactuar con la base de datos por medio de un lenguaje 
interactivo de consultas (como por ejemplo el SQL, Structured or Standard 
Query Language), o a través de un programa de aplicación en el que se hayan 
integrado uno o más modos de llamar a la base de datos (menús). Las 
interacciones suelen consistir en introducir, modificar o eliminar datos, y 
recuperarlos. 

Permiten definir los modelos de datos. 

Disminuyen la redundancia de órdenes. 


Proporcionan diferentes formatos de presentación de los datos, de acuerdo con 
las necesidades concretas de los usuarios, y aunque compartan los mismos 
datos. 

Facilitan el diselo de nuevos programas de aplicación que utilizan las bases 
de datos. 


La “arquitectura” genérica de este tipo de bases de datos multiusuario, que permite 


trabajar a distintos niveles y compartir los datos desde distintos puntos de vista, se 
denomina ANSI-SPARC (del American National Standards Insitute). 


1.1 Características y organización de una base de datos en un SIG. 


Para que una base de datos resulte operativa, debe ser: 


Segura: previniendo accesos no autorizados y permitiendo diferentes grados 
de accesibilidad. Por ejemplo, un usuario de un SIG sobre la Ciudad 
Universitaria debería poder leer sólo los datos de carácter general y los 
relativos a su centro concreto, pero no debe poder modificarlos ni leer los 
correspondientes a otros centros si ello no se desea. 

Disponible: debe poder ser accesible cuando se necesite, y estar a salvo de 
imprevistos como un corte de energía. 

Correcta y consistente: los datos que se incorporen al sistema han de ser 
ciertos en sí mismos y en relación con los restantes datos. Este aspecto puede 
constituir un verdadero problema cuando se utilizan datos antiguos que pueden 
llegar a ser contradictorios con otros más actuales. 

Por ejemplo, si el SIG de la Ciudad Universitaria utilizara datos sobre la 
edificación existente hace una década, definiría como solar sin edificación la 
parcela que ocupan hoy las viviendas de profesores del Paseo de las Moreras, 
lo que proporcionaría información errónea sobre la superficie edificada, o 
contradictoria si se mezclase con la información referente a la edificabilidad 
consumida. Por ello, cuanto más se sepa de los datos que se manejan, más 
fácil será detectar posibles errores. 


Por otra parte, cada capa debe ser lógicamente consistente; es decir, que 
dentro de cada capa han de estar correctamente definidas las relaciones 
topológicas existentes entre los elementos o los sucesos espaciales. Por 
ejemplo, cada polígono que represente a una parcela deberá ser cerrado y 
poseer un único identificador que sirva de referencia para asociarle los 
atributos. 
Análogamente, la consistencia lógica debe existir también entre las diferentes 
capas de información: por ejemplo, dadas la capa de parcelación y la de 
propietarios del suelo, el trazado de los polígonos que representan las parcelas 
debe ser coincidente en ambas. 

- Y a prueba de tecnologías: los datos no deben verse afectados por los cambios 
tecnológicos ni de los componentes físicos del sistema, ni de los programas. 


RTS 


Por otra parte, la organización típica de una base de datos consiste en una colección 
de archivos o ficheros con denominación propia, que el ordenador es capaz de crear, 
manipular y eliminar. 

Un archivo es una secuencia de registros, generalmente del mismo tipo: por ejemplo, 
“parcelas” en el ámbito de la Ciudad Universitaria. 


Los registros son secuencias de datos correspondientes a una misma entidad lógica. 
Por ejemplo, el archivo “Parcelas - Estado Actual” se compone de tantos registros (P1, 
P2,..Pn) como parcelas haya diferenciadas en el momento en el dominio de aplicación. 
Si todos los registros poseen igual tamaño en bytes, el archivo se compone de 
registros de longitud fija. 

A su vez, cada registro incorpora datos relativos a una serie de campos. Éstos 
recogen las diferentes características o propiedades de las entidades de las que se 
tienen datos. Por ejemplo, de cada parcela se pueden obtener datos relativos al “uso”, 
superficie”, “propietario”, “edificabilidad”, etc. 


Un campo cuya longitud varíe de acuerdo con el contenido, se denomina campo de 
longitud variable. Es el caso habitual de los que contienen comentarios. 

Entre los campos existe uno especial, llamado el campo clave, que es único para cada 
registro y que lo identifica y distingue de entre los demás sin ambigúedad. En el 
ejemplo que desarrollamos podría un número de parcela, utilizando números naturales 
no repetidos. 


Todo ello se representa por medio de tablas en las que las filas son los registros, y las 
columnas son los campos. Y son las casillas de la tabla las que se rellenan con los 
datos. 


REGISTRO 


Siguiendo con el ejemplo, la estructura del archivo “Parcelas” sería: 


ARCHIVO PARCELAS DE LA CIUDAD UNIVERSITARIA 


Rellenándose posteriormente con los datos las casillas en blanco de la tabla. 


También resulta frecuente codificar ciertos datos de modo que se pueda ahorrar 
espacio de almacenamiento. 

Por ejemplo, si asignamos al uso “docente” el valor 100, al de “investigación” el valor 
200, etc., en la tabla aparecerán tres dígitos en lugar de las cadenas de caracteres 
más largas, y se habrá creado un campo de longitud fija que favorece la compacidad 
en el almacenamiento de los datos. 


La unidad más pequeña de información que se graba en un disco se definió 
anteriormente como un “bloque” (disk block). Los archivos se ubican físicamente en un 
disco asignándoseles disk blocks para contener los registros. Si el disk block es más 
pequeño que el registro, éste tendrá que extenderse a lo largo de varios bloques, pero 
es más frecuente que cada bloque contenga varios registros. 

Si varios registros sucesivos se sitúan en bloques adyacentes, se dice que sus 
posiciones son contiguas (contiguous allocation); pero esta organización puede 
alterarse cuando se mueven los registros, por lo que se recurre a otros tipos de 
colocación como la vinculada (linked allocation), que relaciona ciertos bloques entre 
sí. 


El tiempo que el ordenador emplea en transferir un block desde o hacia un disco es 
importante, sobre todo cuando se manejan grandes cantidades de datos, y se puede 
descomponer en tres componentes: 


- El tiempo de búsqueda, que es el que emplea el movimiento mecánico de la 
cabeza lectora hasta encontrar la pista correcta, y que es el factor que más 
influye en la búsqueda de un dato desde un dispositivo de almacenamiento 
secundario. 

- El tiempo de latencia, que es el tiempo que tarda el disco en girar hasta la 
posición adecuada. 

- Y el tiempo de transferencia a la CPU, que es el que se requiere para introducir 
el block en la CPU. 

Por tanto, para reducir la influencia del tiempo de búsqueda las BDs se diseñan de 

modo que en lo posible los datos que tengan que acceder juntos a la CPU estén 

próximos en el disco, o bien se les dota de algún tipo de Índice que remita la búsqueda 


directamente a los archivos que se requieren. 


En general, cuando se habla de la organización de los archivos no sólo se trata de la 
organización física de los registros en el disco -o unidad de almacenamiento 
secundario-, de cómo se hayan introducido los datos en él, sino también en el modo 
en que están vinculados los bloques de registros. 

Una vez situados los archivos en el dispositivo de almacenamiento, se pueden buscar 
por medio de los llamados métodos de acceso, que determinan el modo en el que el 
usuario va a manipular los archivos, y que consisten en un conjunto de operaciones 
primarias muy conocidas como son “abrir” (open), “encontrar” (find), “leer” (read), 
“borrar” (delete), “modificar” (modify), “insertar” (insert) y “cerrar” (close). 

Un método de acceso complejo se compondrá de una secuencia de tales operaciones. 
Por ejemplo, para cambiar la “superficie” de una parcela cuyo identificador se conoce - 
por ejemplo, P81-, habrá que abrir el archivo “Parcelas”, buscar el registro de la 
parcela P81, modificar el dato correspondiente al campo “superficie”, y cerrar el 
archivo. 


Por tanto, las bases de datos se diseñan generalmente para ser flexibles y para poder 
responder a una gran variedad de consultas. En los SIG es frecuente que algunas de 
estas consultas no sean previsibles de antemano, por lo que deben proporcionar una 
base estadística potente para hacer frente a los futuros patrones de búsqueda 
posibles. 
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Las bases de datos de los SIG suelen ser muy dinámicas, variando sus contenidos 
con frecuencia, lo que resta eficacia a los métodos de organización por simple 


grabación sucesiva. 


De acuerdo con el movimiento previsible de los datos en el SIG, existen diferentes 
maneras de estructurar los datos dentro de ellos, que tienen importantes 
consecuencias en las operaciones introducción de nuevos datos y de recuperación de 


los ya existentes. 
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2. Las estructuras de los archivos de datos: no ordenadas, secuenciales, 
fragmentadas e indexadas 


Las entidades o fenómenos que se estudian y que se hallan dentro del dominio de 
aplicación, poseen dos componentes claramente diferenciables cuales son la 
componente espacial y la atributiva. 

El SIG integra ambas componentes como datos dentro de archivos. 


- Base cartográfica 
+ BD alfanumérica 


$ Temo, max_jul: 32,3 
1] Temp_min_pat ur. 


Ey 7 
“Pat Chias 


El modo de introducir los datos proporciona una estructura a los archivos que resulta 
importante a la hora de recuperar aquéllos. Son cuatro los modos habituales de 
estructurar los archivos: el modo no ordenado, el modo ordenado o secuencial, el 


modo fragmentado y el indexado. 
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2.1  Laorganización no ordenada. 


Una organización de archivos no ordenada supone que los nuevos registros que se 
insertan en el archivo lo hacen en la posición siguiente del disco, tanto a partir del 
último block utilizado, como a partir de uno nuevo. Es una lista simple y la forma más 
sencilla de almacenamiento, porque cada nuevo dato sólo se alade a la lista de datos 
ya existente, resultando por ello bastante eficaz a la hora de introducir los datos. 


El problema surge al buscarlos, pues al no existir ningún tipo de estructura aparte del 
orden de entrada, hay que comenzar la búsqueda desde el principio del archivo, en un 
acceso secuencial. Es decir, que para una lista de n registros, se requiere una media 
de (n + 1)/2 operaciones de búsqueda hasta encontrar el registro que se desea. 

Por ejemplo, para los edificios de la Universitaria podemos construir la siguiente tabla 


CONSERVACIÓN 


con una estructura no secuencial. 


ESTRUCTURA NO ORDENADA 


N* REGISTRO | N* EDIFICIO 


UA ¿AR 
IO NES 


CATÁLOGO 
(PROTECCIÓN) 


Esta estructura resulta aceptable cuando sólo se requieren listados; por ejemplo, si se 


quisiera imprimir una ficha de cada parcela. 


Los problemas surgen cuando se quieren efectuar accesos directos y aleatorios, ya 
que se requiere información específica de los registros que se buscan. 
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Por ejemplo, si se quieren localizar las parcelas que tienen un nivel de protección dado 
en el Catálogo de la Edificación -supongamos que “Estructural l”-, es necesario 
examinar los valores que adopta el campo correspondiente en cada uno de los 
registros hasta que aparezca el que se desea. 

Este tipo de búsqueda es lineal y debe evitarse en lo posible porque consume mucho 
tiempo. De hecho, si tuviéramos que buscar una parcela determinada entre un total de 
100 registros -uno por parcela-, habría que realizar una media de (100 + 1)/2 
operaciones de búsqueda. 


Además, es un tipo de estructura que origina vacios cuando se borran registros, y 
aunque se pueden volver a llenar, el proceso de inserción es muy lento. 


22  Laestructura secuencial. 


En cambio, en la estructura secuencial u ordenada al menos uno de los campos está 
ordenado según una secuencia, que puede ser incluso la de introducción de los datos, 
pero que puede ser también alfabética, etc. 

Siguiendo el ejemplo de los edificios, la codificación de tres dígitos asignada al campo 
de los usos permite ordenar los registros siguiendo la secuencia 100, 200,... 900. Este 
campo “ordenador” tendrá que poder ordenarse completamente -según los números 
enteros, según el orden lexicográfico de las cadenas de caracteres, etc. 


La ventaja de este sistema es que permite búsquedas binarias aplicando un 
algoritmmo de búsqueda binario. Es además más rápida -el número de accesos se 
puede calcular con la función logarítmica log, (n) cuando no son mayoría los registros 
que verifican la condición de búsqueda-, porque generalmente comienza por la mitad 
del archivo e inmediatamente se sabe si ha de continuar en sentido ascendente o 
descendente. 

Por ejemplo, una condición de búsqueda podría ser el de los edificios cuyo uso es 
“igual” al “300” -equivalente al definido como “administrativo universitario”. Si 


contamos con un total de 1000 blocks en los que se ha almacenado el archivo de los 
14 


usos de las parcelas, una búsqueda lineal requeriría una media de 500 acccesos a los 
blocks, mientras que si los registros estuviesen ordenados por el uso, se requerirían 


aproximadamente log» 1000 10 accesos. 


Muchas búsquedas se basan en condiciones de intervalo, en lugar de en condiciones 
de igualdad. Por ejemplo, se pueden localizar todas las parcelas cuyas superficies 
estén comprendidas entre los 2000 y los 4999 m?. Para ello el campo ordenador tiene 
que ser el de “superficies”. 

Obviamente, si se realizase la búsqueda por otro campo, ésta volvería a ser lineal. 


El problema principal aparece cuando hay que introducir nuevos datos, pues si no se 
les ha previsto un sitio dentro del orden, se requiere una reordenación; lo mismo 
sucede con los registros borrados, cuyo espacio puede ser llenado de nuevo. 


En el ejemplo de los edificios del Campus, la estructura de la tabla será la siguiente: 


ESTRUCTURA SECUENCIAL 


N* REGISTRO N* EDIFICIO. | CONSERVACIÓN | CATÁLOGO 
(PROTECCIÓN) 


15 


2.3 Organización fragmentada. 


Un archivo fragmentado se organiza utilizando una función fragmentadora (hash 
fuction) que transforma los valores del campo fragmentado en una dirección dentro de 
un block en el cual se coloca el registro. 


Por ejemplo, supongamos que contamos con 1000 blocks para el archivo de parcelas. 
Se puede fragmentar el campo del identificador de las parcelas -supongamos que es 
un número entero de 4 dígitos- tomando los dos últimos para que actúen como 
etiqueta del block: la parcela 2035 se situará en el block etiquetado como 35. 


Para buscar los registros en un campo fragmentado sólo se necesitará, por tanto, un 
único acceso al disk block. 


Esta técnica es muy sencilla, pero se complica cuando los blocks se saturan, y resulta 
difícil asegurar una distribución adecuada si no hay espacio en todos ellos. Por ello se 
necesita saber de antemano el número de blocks que se van a necesitar antes de 
elegir la función de fragmentación -por ejemplo, tomando el último dígito, o los tres 
últimos. 


2.4 Organización indexada. 


Las organizaciones en lista y secuencial ordenada, requieren que los datos se 
recuperen de acuerdo con un atributo o campo-clave. Pero en muchas aplicaciones, y 
entre ellas las vinculadas con la información geográfica, las entidades o fenómenos 
individuales no sólo tienen un campo o atributo identificador -un nombre o una clave 
numérica-, sino también otros atributos asociados que además, son frecuentemente 
los que se quieren buscar. 
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Por ejemplo, supongamos que tenemos las parcelas de la Universitaria ordenadas por 
el tipo de uso que pueden soportar, pero que necesitamos información sobre el nivel 
de Protección asociado: salvo que se disponga otra estrategia de búsqueda, se tendrá 


que proceder por el método de la lista. 


Los índices (indexes) aceleran la actuación sobre los otros campos, porque actúan 
igual que los índices de los libros, ordenando los nombres de los objetos indexados de 
modo que se puedan localizar rápidamente. 

El archivo suplementado con un índice se denomina archivo de datos (data file), y en 
él el índice actúa como un campo independiente llamado campo indexador (indexing 
field). 

También se crea un campo indicador (pointer field) que contiene las direcciones de los 
disk blocks que contienen el valor del índice. Además, un índice puede actuar sobre 


más de un campo. 
La estructura indexada se puede aplicar a cualquier archivo tomando como referencia 
un campo determinado, lo que facilita la búsqueda de los datos; además, si se 


introducen nuevos datos sólo hay que indexar de nuevo el archivo. 


Es la estructura más eficaz y la que proporciona mayor libertad en el manejo del 


archivo, porque permite indexar tantas veces como sea necesario. 
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ESTRUCTURA INDEXADA 


Índice 


CAMPO INDEXADOR CAMPO INDICADOR 


Investigación Veterinaria 200.502 
Investigaciones Agrarias 33.576 
Puerta de Hierro 78.146 


Junta de Energía Nuclear 171.318 
Este 


Prácticas Agrónomos Norte 
Estadística 


Libre Almudena Sur 
BLOCK 2 


Colegio Pío XII 


Colegio Casa del Brasil 


BLOCK 100 
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3 Las relaciones existentes entre los datos: “uno a uno”, “uno a muchos”, 


“muchos a muchos” 


Si se observan con detenimiento los datos introducidos, se puede deducir la existencia 
de cierto tipo de relaciones entre los diferentes campos. 
Análogamente tales relaciones pueden reproducirse entre los campos y las entidades, 


y se pueden agrupar en los tipos siguientes: 


- La relación “uno a uno” es biunívoca, de modo que a cada valor de un campo 
corresponde únicamente un valor en el otro campo. Un ejemplo de ello es la 
relación que existe entre cada entidad y un único identificador: 


IDENTIFICADOR «=> PARCELA 


- La relación “uno a muchos” permite que a. diferentes valores de un mismo 
campo les pueda corresponder el mismo valor en otro campo. Por ejemplo, 
varias parcelas pueden tener el mismo uso: 


EDIFICIO USO 
3 


- La relación “muchos a muchos” es aquélla en la que cualquier valor de un 
campo se corresponde con varios de otro campo, y viceversa. Tal sería la 
relación existente entre los campos “uso” y “conservación”: 


USO CONSERVACIÓN 
100 Buena 
200 Regular 


300 a Mala 
800 
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- Finalmente, la relación de dependencia funcional es aquélla que se produce 
cuando para conocer el valor de uno o varios campos es necesario conocer 
previamente los valores de otro u otros campos. Por ejemplo, para conocer el 
porcentaje de ocupación de las parcelas se requiere un campo previo que 
recoja su área, y otro que posea los valores de la superficie ocupada por las 
edificaciones en cada parcela. 


El conocimiento y definición de tales relaciones resulta esencial a la hora de diseñar el 
modelo de datos concreto que interesa para una determinada aplicación. 


4 Ordenaciones uni- y bidimensionales 


Los comentarios anteriores son extensivos a cualquier base de datos de propósito 
general, en la que los archivos son multidimensionales, es decir, que cada entidad 
posee varios atributos independientes -aunque ya se ha puesto de manifiesto que hay 
casos en los que puede existir cierta dependencia, que puede eliminarse manipulando 
los archivos y manteniendo los de origen. 

Los datos espaciales presentan una relación de dependencia entre ellos que se 
expresa en el espacio euclídeo por medio de la métrica euclídea. 


Consideremos por ejemplo los datos de algunos puntos clave de la Universitaria que 
se representan de forma tabular y en forma de malla. 
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UNED Norte 
Agrícolas 
Escuela de Telecomunicaciones 
Arquitectura Técnica 

Veterinaria 

Geografía 

Letras 

Ciencias 

CEU Arquitectura 

Estadística 

Escuela de Caminos 

Escuela de Montes 

Ciencias de la Educación 
Ciencias de la Información 
Escuela de Agrónomos 

Medicina 

UNED Suroeste 

Bellas Artes 

Escuela de Arquitectura 

Escuela de Aeronáuticos 

Escuela de Navales 

UNED Sur 

Forestales 

Ingenieros Técnicos Aeronáuticos 
Investigación Politécnica 


Para buscar entre estos datos, podemos utilizar dos tipos de condiciones: 

- Condiciones de punto: que satisfacen todos los registros cuyas referencias 
espaciales coincidan con el punto dado. 

- Condiciones de intervalo: que verifican todos los registros cuyas referencias 
espaciales se encuentren dentro de un intervalo dado. Este intervalo puede ser 
una forma cualquiera, aunque se suele utilizar una superficie rectangular 
definida por las coordenadas de dos vértices opuestos, o un círculo definido 


por el centro y el radio. 
Las consultas que se pueden hacer son: 


la No espaciales: “Localizar el punto correspondiente a la Escuela de 
Arquitectura”. 
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Esta consulta proporciona una posición en el espacio, pero se contesta 
buscando en el archivo un campo no espacial (Escuela de Arquitectura = punto 
81). 


Para ello se puede utilizar cualquiera de los métodos de acceso comentados 
para las bases de datos de propósito general. 


a 
ER 


= 
pan 
¡e 


y 


po 
mM 


0 o 
Dm 


Localización de algunos puntos de interés (centros docentes universitarios) en la Ciudad Universitaria 


Pi Consulta del punto: “Buscar cualquier lugar situado en la posición (1500,840)”. 
Esta consulta utiliza una condición espacial de búsqueda. Si no se establece 
ningún orden, aquélla será lineal: 


Paso 1. Abrir el archivo de los Centros de la Ciudad Universitaria 
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Paso 2. 


Mientras haya registros que examinar, seguir los pasos 3.1 a 3.4 


Paso 3.1 Acceder al siguiente registro 
Paso 3.2 Si el valor del primer campo de coordenadas es 1500 
Paso 3.3 Entonces Si el valor del segundo campo coordenado es 840 
Paso 3.4 Entonces obtener del registro el nombre del 
centro 
ze Consulta de intervalo: “Buscar cualquier lugar en el rectángulo cuyos vértices 


suroeste y noreste son, respectivamente, (1200,600) y (1600,1000). 


La secuencia de la consulta lineal será, en este caso: 


Paso 1. 
Paso 2. 
Paso 3.1 
Paso 3.2 


Paso 3.3 


Paso 3.4 


Abrir el archivo de Centros de la Universitaria 
Mientras haya registros que examinar, seguir los pasos 3.1 a 3.4 
Acceder al siguiente registro 
Si el valor del primer campo de coordenadas está dentro del 
intervalo [1200,1600] 
Entonces Si el valor del segundo campo de coordenadas 
está dentro del intervalo [600,1000] 
Entonces obtener del registro el nombre del 


centro 


Pero también se puede agilizar la búsqueda construyendo dos índices para los dos 


campos espaciales de coordenadas (índices Este y Norte); como cada uno afecta a un 


sólo campo, se pueden considerar unidimensionales, al igual que las operaciones de 


búsqueda que con ellos se realizan. 
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Índice Este 


Centro 


Veterinaria 
UNED Norte 

Investigación Politécnica 
Estadística 

Geografía 

UNED Suroeste 

Bellas Artes 

UNED Sur 

Escuela de Caminos 

Arquitectura Técnica 

Letras 

Escuela de Arquitectura 

Agrícolas 

Ciencias de la Información 
Escuela de Agrónomos 

Escuela de Telecomunicaciones 
Ciencias 

Medicina 

Escuela de Aeronáuticos 

Escuela de Navales 

Forestales 

Ingenieros Técnicos Aeronáuticos 
Escuela de Montes 

CEU Arquitectura 
Ciencias de la Educación 


INDICE ESTE 
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Indice Norte 


UNED Sur 

UNED Suroeste 
Investigación Politécnica 
Arquitectura Técnica 
Escuela de Navales 
Bellas Artes ki 
Escuela de Arquitectura 
Escuela de Aeronáuticos 
Ingenieros Técnicos Aeronáuticos 
Escuela de Agrónomos 
Agrícolas 

Medicina 

Ciencias de la Información 
Geografía 

Estadística 

Escuela de Caminos 
Forestales 

Veterinaria 

Letras 

Ciencias 

Escuela de Montes 
Ciencias de la Educación 
UNED Norte 

CEU Arquitectura 

Escuela de Telecomunicaciones 
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Las dos secuencias de puntos que resultan de los órdenes respectivos se muestran 
con diferentes tipos de línea en la ilustración adjunta. 


Si volvemos a la 2? Consulta, se dirige la búsqueda por el índice Este hasta que 
encuentre los registros cuyo valor es 1500; después accede a la tabla general hasta 
encontrar aquéllos cuyo valor coincide con 840. 


En cuanto a la 3? Consulta, se puede establecer un intervalo de búsqueda en el índice 
Este entre los valores 1200 y 1600, del que resultará una lista de puntos indicadores 
del archivo de datos. 

Para cada uno, el sistema accederá al registro correspondiente y comparará el valor 
de la coordenada Norte, y extraerá aquéllas que se encuentren en el intervalo 
[600,1000]. 


Como se puede comprobar, en estas búsquedas sólo se ha utilizado un índice. 
Por tanto, lo que se puede hacer es buscar otro tipo de índice que permita ordenar en 
las dos dimensiones. 


El primer problema que se plantea es que el sistema de almacenamiento de los datos 
en el sistema es básicamente unidimensional. 

Por tanto, se han ideado una serie de técnicas de búsqueda que persiguen 
distorsionar al mínimo dominios bidimensionales al trasladarlos al formato 
unidimensional. 


Estas técnicas se basan en la aplicación de una función llamada índice mosaico (tile 
index), que tiene la propiedad de que los puntos que están próximos en el plano 
euclídeo, estarán próximos también al “camino” que la función dibuja. 

Y en el caso de que se trabaje sobre una retícula discreta, el índice traza un camino 
por la trama plana, y aunque la propiedad no se verifica exactamente en todos los 
puntos, los índices mosaico resultan suficientemente eficaces en la mayor parte de los 
casos en los que se aplican. 
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Comentarios bibliográficos 


Entre los textos de consulta general sobre las bases de datos, se puede citar el de 
Elmasri y Navathe (1994), y el introductorio de Date (1995). 


Sobre la organización de los archivos, Ferrer ¡ Juliá et alii (1997) en el capítulo 1, y 
Burrough (1986) en la primera parte del capítulo2, presentan el tema en lo esencial y 
con claridad; y Smith y Barnes (1987) lo abordan con detalle. 


Para profundizar en las consultas espaciales, Abel y Mark (1990) presentan las 
diferentes posibilidades, y Worboys (1995) describe brevemente en el capítulo 6 las 
diferentes técnicas de búsqueda. 


La Parte 5 del libro de Cebrián (1994) profundiza sobre las técnicas concretas de 


indexación. También se encuentran referencias más generales en los capítulos que 
dedican a las definiciones de estructuras raster Gutiérrez Puebla y Gould (1994). 
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